دسته بندی متن براساس مدل های یادگیری احتمالی

پایان نامه
چکیده

با گسترش روزافزون اطلاعاتی که بشر در اختیار دارد، مساله سازماندهی خودکار این اطلاعات اهمیت ویژه ای می یابد. در این میان کار دسته بندی اسناد متنی در گروه های جداگانه بعنوان یک مساله مرکزی باید مورد بحث و بررسی قرار گیرد. دسته بندی بعنوان یک روش مهم در آنالیز داده ها مطرح است و روش های متعددی درهوش مصنوعی و شناسایی آماری الگو برای این کار پیشنهاد شده است اما استفاده مستقیم از این روشها در کار دسته بندی متن امکان پذیر نمیباشد چرا که در این مساله با تعداد زیادی مشخصه روبرو خواهیم بود. در این پایان نامه سعی بر این است که مفاهیمی را که در کار دسته بندی متن با آن روبرو هستیم را مورد بررسی قرار دهیم، این مفاهیم شامل: استخراج مشخصه ها از متن، نحوه نمایش متن، انتخاب زیر مجموعه ای از مشخصه ها و الگوریتم های یادگیری ماشین مناسب برای این کار خواهد بود. در مورد انتخاب مشخصه ها سعی شده است ارتباط بین دسته بندی احتمالی با معیار استفاده شده برای انتخاب مشخصه ها نشان داده شود. در نهایت یک چهارچوب احتمالی برای دسته بندی اسناد متنی بطور کامل مورد بررسی قرار گرفته است. در این چهار چوب احتمال ((متعلق بودن)) یک سند برای هر کلاس تخمین زده می شود، در این راستا از شبکه های بیز بعنوان یک روش کارا و موثر برای نگهداری احتمال توام متغیرها استفاده شده است. در نهایت ساختار مناسب برای ساخت یک مدل دانش با استفاده از شبکه های بیز پیشنهاد شده است. در عمل سعی شده است با اندازه گیری کارایی، موثر بودن این روش ها در مقایسه با یکی از روش های کلاسیک ذخیره و بازیابی اطلاعات نشان داده شود، در روش پیشنهادی برای هر کلاس یک دسته بند طراحی شده است که در نهایت همگی در کنار هم بصورت موازی کار می کنند. برای انجام یادگیری و تست از داده های روییتر استفاده شده است و آزمایشات روی 5 گروه از این داده ها انجام شده است در نهایت بعد از ساخته شدن دسته بندها موثر بودن استنتاج در این مدل ها نشان داده شده است.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

دسته بندی سبک های یادگیری با استفاده از ویژگی های رفتاری و ماشین بردار پشتیبان دو قلو

موفقیت تحصیلی دانشجویان از اهداف مهم در محیط‌های آموزشی است. یکی از عوامل مهم در تحقق این هدف، توجه به سبک یادگیری دانشجویان است. آگاهی از سبک یادگیری دانشجویان به طراحی یک روش مناسب آموزش کمک می‌کند. لحاظ کردن یک شیوه مناسب آموزش باعث بهبود عملکرد دانشجویان در محیط آموزشی می‌شود. در این مقاله، هدف ساخت یک مدل برای تشخیص خودکار سبک‌های یادگیری است. بدین منظور از یک محیط آموزش الکترونیکی متشکل ا...

متن کامل

ارائه ی یک مدل جهت دسته‌بندی متون فارسی با استفاده از ترکیب روش های دسته بندی

برای دسته­بندی متن از تکنیک­های استخراج اطلاعات، پردازش زبان طبیعی و یادگیری ماشین به طور وسیع استفاده می‌شود به طور کلی هدف یک دسته بند متون، دسته­بندی اسناد در قالب تعداد معینی از دسته­های از پیش تعیین شده می­باشد. هر سند می‌تواند در یک، چند و یا هیچ دسته‌ای قرار بگیرد. در مورد هر سند به این سؤال پاسخ داده خواهد شد که این سند در کدام یک از دسته­ها قرار می‌گیرد. این موضوع می‌تواند در قالب یک ی...

متن کامل

ارائه ی یک مدل جهت دسته‌بندی متون فارسی با استفاده از ترکیب روش های دسته بندی

برای دسته­بندی متن از تکنیک­های استخراج اطلاعات، پردازش زبان طبیعی و یادگیری ماشین به طور وسیع استفاده می شود به طور کلی هدف یک دسته بند متون، دسته­بندی اسناد در قالب تعداد معینی از دسته­های از پیش تعیین شده می­باشد. هر سند می تواند در یک، چند و یا هیچ دسته ای قرار بگیرد. در مورد هر سند به این سؤال پاسخ داده خواهد شد که این سند در کدام یک از دسته­ها قرار می گیرد. این موضوع می تواند در قالب یک ی...

متن کامل

معرفی، دسته بندی و شیوه شناسی کتیبه های صحیفی جوهری

صحیفی جوهری یکی از چیره‌دست‌ترین خوش‌نویسان ثلث دوره صفوی است که دستی هم در شعر داشته؛ با این حال، چنان که باید شرح احوال و آثارش در تاریخ خوش‌نویسی ایران مورد توجه قرار نگرفته است. صحیفی از بزرگ‌زادگان طایفة ذوالقدر شیراز بوده که در اصفهان رشد کرده و همانجا نیز وفات کرد. این پژوهش در نظر دارد ضمن معرفی آثار موجود و قابل دسترس این خوش‌نویس، به دسته‌بندی آن‌ها از چند منظر مختلف بپردازد و شیوة نگ...

متن کامل

معرفی، دسته بندی و شیوه شناسی کتیبه های صحیفی جوهری

صحیفی جوهری یکی از چیره‌دست‌ترین خوش‌نویسان ثلث دوره صفوی است که دستی هم در شعر داشته؛ با این حال، چنان که باید شرح احوال و آثارش در تاریخ خوش‌نویسی ایران مورد توجه قرار نگرفته است. صحیفی از بزرگ‌زادگان طایفة ذوالقدر شیراز بوده که در اصفهان رشد کرده و همانجا نیز وفات کرد. این پژوهش در نظر دارد ضمن معرفی آثار موجود و قابل دسترس این خوش‌نویس، به دسته‌بندی آن‌ها از چند منظر مختلف بپردازد و شیوة نگ...

متن کامل

رویکرد شبیه‌سازی در حل مسأله زمان‏بندی ماشین‏ های موازی پردازشگر دسته ‏ای با زمان‏ های احتمالی

در این مقاله، مسأله‏ زمان‏بندی ماشین‏های موازی پردازشگر دسته‏ای با هدف حداقل کردن حداکثر زمان تکمیل کارها بررسی می‌شود. نوآوری این پژوهش، به کارگیری زمان های پردازش و در دسترس بودن کارها به صورت احتمالی است. در تحقیقات پیشین اثبات شده است که مسأله‏ مورد بررسی دارای پیچیدگی سخت است. بنابراین، از روش‏های ابتکاری برای حل مسأله استفاده می‏شود. مسأله مورد مطالعه، دو مرحله تصمیم‌گیری دارد. در مرحله ا...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023